Time
单个项目时间
01 | 02 | 03 |
---|---|---|
收集数据 | 建模 | 产品 |
20%-60% | 10%-20% | 5%-15% |
可以从左图清晰地看出,数据科学从业者们在数据收集上花费了大量时间,平均占整个项目时间的40%左右。其次花费时间较多的为建模,选择为20%左右的人数最多。对一个项目来说,面对全局数据进行数据采集,建立模型和分析系统,系统的复用程度往往很高,降低重复投资,可提高效率,是整个项目中至关重要的部分。而用在可视化和阐释观点的时间相对较少,一般来说,仅占整个项目的百分之10左右。
工作时间
总体来说,传统的全职工作者仍占据相当大的比例,总共有10897人,占全体被访者的68.1%。自由职业者有1330人左右,占总体被访者的8.3%左右。已经退休后仍在从事数据科学的人数最少,仅有118人。
skill
如图所示,python和R作为最受欢迎的语言被大量数据科学从业者推荐使用。这两种语言的发展十分令人印象深刻,在较短的时间内显示出非常快速的增长。它们学起来相对容易,并且有广泛的目标模块和社区支持。
在被问及下一年想用的方法是,深度学习的受欢迎程度远远超出了其他方法。其次为神经网络、时间序列分析及贝叶斯方法。